摘要。随着机器学习越来越多地用于辅助决策,人们要求这些决策是可解释的。可以说,最可解释的机器学习模型使用决策规则。本文重点介绍决策集,这是一种具有无序规则的模型,它用单个规则解释每个预测。为了便于人类理解,这些规则必须简洁。早期关于生成最佳决策集的工作首先最小化规则数量,然后最小化文字数量,但得到的规则通常会非常大。在这里,我们考虑一个更好的衡量标准,即决策集的总大小(以文字为单位)。因此,我们不会被一组需要大量文字的小规则所驱使。我们提供了第一种方法来确定实现最小经验风险的最小规模决策集,然后研究稀疏替代方案,以牺牲准确性换取规模。通过找到最佳解决方案,我们可以构建几乎与最佳启发式方法一样准确的决策集分类器,但更加简洁,因此更具可解释性。
主要关键词